Resumen Resultados V2

En este notebook aplicamos los test estadísticos y el algoritmo decisión multicriterio a aquellos modelos que pensamos que sufren de menos overfitting.

Eliminando modelos que padecen overfitting

Cargamos los modelos

Función que predice el instante t tanto en train como en test para cada modelo y muestra las gráficas

De forma gráfica parece que los modelos que más overfitting hacen son Ranfom Forest y GBR (tanto para lag3 como para lag5). Ahora cogemos las medidas de error en la predicción t tanto para train como para test de todos los modelos. Aquellos que tengan una diferencia > 0.2 serán los que consideremos que están sobre ajustando los datos

Leemos las tablas de errores de RMSE y MAE tanto para train como para test

Ahora cogemos las predicciones en t de ambas tablas, es decir, la primera fila de cada tabla

Calculamos las diferencias y aquellas que superen el valor de 0.2 serán los modelos que eliminaremos

Eliminamos los modelos que han hecho overfitting

Tests estadísticos

Partimos de las tablas a las que hemos eliminado los modelos que sobre ajustan los datos y aplicamos los test estadísticos

RMSE

No detecta diferencias significativas

MAE

Detecta diferencias en EN_Lag5 VS GBR_Lag5 y EN_Lag5 VS SVR_Lag3

CC

Detecta diferencias entre Lasso_Lag3 VS RF_Lag5, SVR_Lag3 VS

Generamos la tabla completa y ordenamos

Algoritmo de decisión multicriterio